今天將會提到機器學習派的理論與架構,並為學習理論做一個結尾。
機器學習指的是透過對舊資料的學習,選擇資料的特徵並歸納出隱藏在其中的規則後,建立統計模型,並且對未來輸入的新資料進行分析與判斷。
1.訓練資料的獲取
2.資料特徵的選擇(Feature Selection)與特徵擷取(Feature Extraction)
3.建立預測模型
4.以此模型來判斷未來
例如:我們從未見過大象,當我們看到大象時,會從他龐大的體積、大耳朵、長鼻子中記錄下大象的樣子,當下一次在看到別的動物時,我們就能從這些特徵中判斷出此動物是否為大象。
接下來將談到對機器學習非常重要的監督式學習、非監督式學習與半監督式學習,在前幾天有提過三種學習的概念,接下來就一起深入學習吧。
監督式學習由人類來標註(label)樣本的答案,以此來監督機器判斷是否正確,是準確度最高、最普遍應用的學習方法。
1.分類(Classification):指的是機器透過對過去資料的特徵,使用在新樣本上來判斷新樣本所屬的類別。
2.迴歸(Regression):當x與y是連續變數時,則用過去在x,y上學習到的關係,來預測新的樣本中x所對到的y值。例如透過前幾年銷售額預測今年銷售額。
f(x)=y
例:人臉辨識 f(人照片)=人身份。
可分為非類神經網路的傳統機器學習模型與神經網路深度學習法,演算法包含決策樹、貝式統計分析、隨機森林,在後面文章將會詳細說明。
半監督式學習與非監督式學習將會在明天繼續說明。
參考資料
人工智慧-概念應用與管理 林東清著